作者丨王悦
编辑丨董子博
从线下交易转为线上交易的第一步,便是开户的身份认证。
在菲律宾开通一个货币账户,到底有多难?来自中国的技术专家亲眼目睹了当地居民,乘坐一个多小时的公交车,来到一个网点,提交一堆纸质资料,资料被集中送到一个审核点,再去等待漫长的纯人工审核。
正常情况下,从递交资料到账户开通,整个流程耗时约一个星期,如果用户量翻倍,人工审核团队的人数也要随之翻倍。
受到人力、门店数量等限制,开户认证过程效率低、体验差,通过率自然非常低,能真正坚持下来完成开通的用户只有发起者的3%。
某机构一天只能服务几十个用户,等待做身份认证的用户排到了一年以后。
身份认证专家却“难证清白”
蚂蚁集团安全科技平台ZOLOZ的李哲认为,只有用数字技术做身份认证,才能够摆脱人力瓶颈,实现高效便捷的开户体验,为数字化发展提速。
于是他背起行囊,雄心勃勃,准备用自己多年的技术能力奔赴菲律宾,开启线上身份认证的“拓荒”之旅。
而现实却给了这位中国身份认证专家“当头一棒”。李哲刚到菲律宾,就被机场海关拦入了“小黑屋”。
原因是,当地刚刚发生一起案件,在逃嫌疑人也叫“LI ZHE”。
签证信息有限,当地海关没法确认此“李哲”非彼“LI ZHE”,李哲不得不亲自跑去当地移民局,填写书面材料,当面说明自己不是那个“LI ZHE”,又去当地法院,说明自己没有犯罪。
两个机构开具的证明要在以后的每次出入境时都随身携带,否则还是会发生与之前一样的遭遇。而讽刺的是,李哲前脚刚刚走出移民局大门,一群黄牛就蜂拥而至,追着问:
“假证要不要办?”
李哲万万没想到,工作还没展开,就陷入自身难“证”的境地,人肉体验了一把当地的身份认证状况,他也迅速意识到了问题的严峻。
李哲为证明自己不是某某某而填写的材料
拨开“假证”迷雾,认清“你是你”
019年9月的某天,马尼拉的雷克托大街上,突然一阵喧哗嘈杂。
接到线报称,此处有不法分子正在制造虚假的身份证和驾驶证,菲律宾的警方突击了当地的一个假证制造窝点。仅在这一次行动中,工作人员就查获了342张假驾驶证。
在当地,制造一本假驾驶证,不法分子就可以获得1000比索,而一本伪造的菲律宾护照,就能在黑市上买到3500比索。
猖獗的黑产背后,其有恃无恐之处在于当时并不发达的假证识别技术,这直接锻造了五花八门的造假手段:对电脑或手机屏幕翻拍并不属于自己的证件、拍摄打印复印件、遮挡篡改、高仿定制等。
除了造假手段多样化之外,近30种证件都被认可为官方证件,却没有统一官方库可以进行信息比对,也给身份认证带来巨大的障碍。
ZOLOZ想在一带一路沿线国家和地区,实现的是和中国一样,用户全自助、无人工干预完成金融机构的“在线身份认证”,机器远程识别“你是谁”,以及准确判断“你是你”,你不是那个被别人冒充的你。
当时品类繁多的菲律宾证件在版面设计与制证工艺上存在很大差异,主体色彩、底纹样式、防伪膜、照片、格式与顺序、字体样式等要素各有特点,需要用到OCR技术识别每一个证件上面的文字信息,从而完成“让机器识别你是谁”这第一个小目标。
然而,更大的挑战在于“如何准确判断你是你”,以应对身份篡改、冒用,带来的欺诈、薅羊毛、洗钱风险。
魔高一尺,道高一丈。在图像识别方面,ZOLOZ算法团队敏锐地发现了翻拍证件图片通常带有明显的摩尔纹图案或者反光特征,并且在一些拍摄角度下,还能观察到图片中屏幕边框,窗口边框等,采用细粒度识别技术,他们提出了多尺度的证件翻拍检测算法。
ZOLOZ团队还发现了“用打印件冒充真实证件”的检测突破口,由于两者材质不同,当有平行光射入时,两者具有不同的漫反射率。因此,他们尝试改变产品交互,在拍摄证件的瞬间开启闪光灯,通过“闪光帧”来甄别打印件;此外,通过遮挡区域边缘的梯度异常(阴影)和遮挡区域内部的纹理差异信息,来判断证件是否被遮挡篡改……
结合这些发现,ZOLOZ探索了一套全球证件防伪算法体系,在2019年,ZOLOZ成为全球首家通过HKMA(香港金融管理局)警署假证测试的企业。截至目前,相关技术已经产出相关专利100余篇。
保护数据隐私,让模型左右手互搏
找到了假证识别的突破口,ZOLOZ团队又马上要迎接一个新的命题。
训练数据是模型训练、迭代的基础,但可用于模型训练的攻击样本数据非常少。而团队基于数据隐私保护的准则,对真实数据的调用也极度克制。不同于其他的AI领域,在安全攻防方向上,预训练阶段“不用真实数据训练"的理念似乎已在团队内约定俗成。
“如果真要收集足够的真实样本再去升级模型,可能还没升级完,就已经被‘打趴下了’。我们要在隐私保护的原则下,找到其他的突破口。” ZOLOZ 身份安全算法负责人李哲告诉雷峰网(公众号:雷峰网)。
于是,ZOLOZ自研了两套快速生成数据的方法,即物理生成和数字生成。
所谓物理生成,就是模仿黑产的攻击套路、变换各种姿势,自己制作可供模型训练的假证样本。
疫情期间的一个春节,ZOLOZ 团队的一名工作人员,和他的家人刚刚吃完年夜饭,围坐在餐桌前。不同于其他人家,新年夜一起包饺子,他们手里剪刀飞舞,把一张张网上下载的图片打印下来按照一定规格剪好,再遮挡在证件上,并且拍照留档。
起初,一张一张剪起来很慢,一家人一个小时只能剪出几十张。熟练后,一小时能剪出一百多张。
“人家过年都是剪窗花,咱们家过年是剪图片。”家人打趣说道。
除夕夜发动全家老小做人工智能训练师的“壮举”,是为了给 ZOLOZ 制作“篡改遮盖攻击”的负样本,就像金庸小说里的左右手互搏,巨大的3000份攻击样本数量为模型练就了一身硬朗结实的腱子肉,提升照片遮挡攻击测试的防御力。
而此举也帮助ZOLOZ在春节后的一次竞标中,超越竞争对手,赢得了菲律宾当时最大银行的订单。
数字生成,显然比物理生成更“高级”。ZOLOZ用起了AIGC 批量生成攻击数据样本,利用生成的样本同样可以实现训练模型的结果,效率更高,效果更逼真。为了增加其生成数据的多样性,ZOLOZ尝试去更换手机型号,摄像头类型,屏幕边框和拍摄环境等。
此外,借助 Stable Diffusion 模型,能对凭证图像进行更丰富的拍屏风格渲染,也能对现有拍屏模型进行摩尔纹对抗攻击等。
AIGC 还帮助 ZOLOZ 扩展现有的数据特征空间,预测到更多新型证件材质伪造类型,引入更多对抗攻击样本来提高模型的防御能力。
这种方式被称为“冷启动”,在数据隐私保护的前提下,让模型在小样本学习中迅速上手。
李哲介绍,如今ZOLOZ的通用防伪能力已经支持全球十多个国家的上百种证件类型,其中大部分证件的防伪标识可以被识别,并具备防御高仿假证的能力,处于业界领先的水平。而冷启动时运用的数据几乎均由AIGC生成,极大地减少了真实数据的使用量。而在线上发现的少量真实的攻击数据成为了模型的测试集,为模型进行调优。
用AIGC打败AIGC
AIGC 给ZOLOZ带来了巨大的助力,而 ZOLOZ 也清楚地看到,虽然目前大多数黑产攻击仍然采用物理生成的方式,但随着AIGC技术的普及,黑产也可能利用AIGC生成更高仿真性和迷惑性的假证,ZOLOZ务必从现在就开始打磨辨别AIGC的能力。
ZOLOZ给出的应对方案是利用自己的AIGC算法,生成大量看起来逼真的证件图片数据,用来训练另一个可以识别AIGC的模型。
李哲对AI科技评论表示道:“为了让训练的模型更加鲁棒,在这个过程中还可以加入对抗技术,根据识别模型在生成数据上的表现,反过来指导优化AIGC算法,再生成更多可以绕过识别模型的样本,从而不断增强识别模型的泛化能力。”
以左手搏右手,以魔法打败魔法——用AIGC技术,来打败未来AIGC的风险,ZOLOZ 的这条路径,未来很可能变成安全认证的一大趋势。
在李哲看来,每道单一的防线也许都不能做到100%完美防御,因此,ZOLOZ不仅仅做图像识别,还结合综合数据决策来实现全链路的纵深防御策略,从注册环节、到开户环节、再到支付验证环节,让多道防线相互补充,形成相对坚实、可信的身份认证体系。
如今,菲律宾电子钱包Gcash的开户时间,从原来的一周降到只需要在家操作3分钟。Gcash的注册用户数超过6600万,每1.7个菲律宾人就有一位在使用。
疫情期间,ZOLOZ 提供的可信身份认证帮助孟加拉国500万个家庭实现远程开户,当地政府通过本地最大的移动支付平台BKash,向失去收入来源的家庭发放援助金。也因此,ZOLOZ 在2021年获得了IDC金融科技真实价值奖。BKash CEO卡迈勒·奎德表示:“ZOLOZ 帮助BKash实现了跳跃式发展,在疫情期间,e-KYC成了我们的救星。”
截止目前,ZOLOZ已经为一带一路沿线国家和地区的上百家合作伙伴提供在线身份认证、风控决策等技术支持,覆盖银行、保险、证券、电信、公众服务等领域。
本文作者:王悦,微信s1060788086。雷峰网将持续关注AIGC、大模型、数字人等领域,欢迎添加作者微信,交流行业信息。